Granite : IBM lance son pavé dans la mare des modèles de langage pour la génération de code

IBM vient de publier une famille de huit nouveaux grands modèles de langage nommée Granite. Celle-ci a la particularité de se concentrer sur les tâches liées au code : générer du code, corriger des bugs, expliquer et documenter le code.

Les huit modèles (de 3 à 34 milliards de paramètres) sont distribués sous licence Apache 2.0. Dans leur article expliquant la création de ces grands modèles de langage, les chercheurs d'IBM indiquent qu'ils ont été entraînés sur les jeux de données de code Github Code Clean et StarCoderdata mais aussi « des dépôts de code publics sur GitHub et des problèmes signalés [ndt : issues en anglais] supplémentaires » dont le jeu de données n'est pas clairement connu.

Dans les tests de comparaison qu'ils ont effectués, les chercheurs montrent que le modèle Granite-8B devance ses concurrents « ouverts » :

À la fin de l'article sont listés les langages sur lesquels la famille Granite peut être utilisée :

ABAP, Ada, Agda, Alloy, ANTLR, AppleScript, Arduino, ASP, Assembly, Augeas, Awk, Batchfile, Bison, Bluespec, C, C-sharp, C++, Clojure, CMake, COBOL, CoffeeScript, Common-Lisp, CSS, Cucumber, Cuda, Cython, Dart, Dockerfile, Eagle, Elixir, Elm, Emacs-Lisp, Erlang, F-sharp, FORTRAN, GLSL, GO, Gradle, GraphQL, Groovy, Haskell, Haxe, HCL, HTML, Idris, Isabelle, Java, Java-Server-Pages, JavaScript, JSON, JSON5, JSONiq, JSONLD, JSX, Julia, Jupyter, Kotlin, Lean, Literate-Agda, Literate-CoffeeScript, Literate-Haskell, Lua, Makefile, Maple, Markdown, Mathematica, Matlab, Objective-C++, OCaml, OpenCL, Pascal, Perl, PHP, PowerShell, Prolog, Protocol-Buffer, Python, Python-traceback, R, Racket, RDoc, Restructuredtext, RHTML, RMarkdown, Ruby, Rust, SAS, Scala, Scheme, Shell, Smalltalk, Solidity, SPARQL, SQL, Stan, Standard-ML, Stata, Swift, SystemVerilog, Tcl, Tcsh, Tex, Thrift, Twig, TypeScript, Verilog, VHDL, Visual-Basic, Vue, Web-Ontology-Language, WebAssembly, XML, XSLT, Yacc, YAML, Zig.

Commentaires (24)


Ah, c'est bien ça. On se rapproche enfin de taille de modèle qui sont utilisables sur des cartes graphiques pas trop cher (<1000€).
Ouais 'fin faut encore une carte graphique de l'enfer pour ça (parce que bon, parler d'inférieur à 1000 balles c'est déjà grotesque, si encore <500...), et j'ai pas l'impression qu'on s'oriente vers la sobriété de manière générale.

seboss666

Ouais 'fin faut encore une carte graphique de l'enfer pour ça (parce que bon, parler d'inférieur à 1000 balles c'est déjà grotesque, si encore <500...), et j'ai pas l'impression qu'on s'oriente vers la sobriété de manière générale.
Pourquoi faire la sobriété ?

Hugues1337

Pourquoi faire la sobriété ?
Parce que c'est bientôt la fin du monde ?
pourquoi ? de l'auto-hébergement ?

S'il y a bien un truc que je ne veux pas auto-héberger pour l'instant c'est un service d'IA. C'est onéreux et ca change tout le temps. Le temps d'écrire ce message il y aura déjà 3 nouveaux modèles annoncés et 5 études qui démontrent qu'il ne faut pas les utiliser.

127.0.0.1

pourquoi ? de l'auto-hébergement ?

S'il y a bien un truc que je ne veux pas auto-héberger pour l'instant c'est un service d'IA. C'est onéreux et ca change tout le temps. Le temps d'écrire ce message il y aura déjà 3 nouveaux modèles annoncés et 5 études qui démontrent qu'il ne faut pas les utiliser.
j'allais dire la même chose, mais du coup s'il y a aussi une chose que je veux pas utiliser c'est des modèle extérieures où je sais pas sur quel data c'est entrainé (plein de données copyrightées volées à droite à gauche), où le code est fermé (la plupart du temps), etc...

Ah ben du coup j'utilise pas d'iA/

127.0.0.1

pourquoi ? de l'auto-hébergement ?

S'il y a bien un truc que je ne veux pas auto-héberger pour l'instant c'est un service d'IA. C'est onéreux et ca change tout le temps. Le temps d'écrire ce message il y aura déjà 3 nouveaux modèles annoncés et 5 études qui démontrent qu'il ne faut pas les utiliser.
Je comprends bien. Je suis même un peu d'accord. Mais au travail, notre chef ne veut pas qu'on utilise des services en ligne pour la confidentialité (même si l'option "ne pas utiliser mon code pour l'entraînement" existe). Alors pouvoir l'héberger sur un serveur, c'est bien.

Je trouve également bien qu'on spécialise des modèles pour des tâches précises. Parce que le nouveau modèle de Google et ses 10Mo d'entrées (et ses éventuelles 1000 milliards de paramètres), c'est pas très sobriété non plus.

bansan

Je comprends bien. Je suis même un peu d'accord. Mais au travail, notre chef ne veut pas qu'on utilise des services en ligne pour la confidentialité (même si l'option "ne pas utiliser mon code pour l'entraînement" existe). Alors pouvoir l'héberger sur un serveur, c'est bien.

Je trouve également bien qu'on spécialise des modèles pour des tâches précises. Parce que le nouveau modèle de Google et ses 10Mo d'entrées (et ses éventuelles 1000 milliards de paramètres), c'est pas très sobriété non plus.
Je parie que dans la même motivation, tout votre service bosse sous Ubuntu :roll: (la version non-pro hein faut rester sérieux :mad2: )

Mais que le reste de la boîte est sous ...

MS Office 365 :dent:

bansan

Je comprends bien. Je suis même un peu d'accord. Mais au travail, notre chef ne veut pas qu'on utilise des services en ligne pour la confidentialité (même si l'option "ne pas utiliser mon code pour l'entraînement" existe). Alors pouvoir l'héberger sur un serveur, c'est bien.

Je trouve également bien qu'on spécialise des modèles pour des tâches précises. Parce que le nouveau modèle de Google et ses 10Mo d'entrées (et ses éventuelles 1000 milliards de paramètres), c'est pas très sobriété non plus.
Hasard de l'Internet (ou algorithme trop intrusif) je suis tombé sur cette vidéo:

https://www.youtube.com/watch?v=Wjrdr0NU4Sk

127.0.0.1

pourquoi ? de l'auto-hébergement ?

S'il y a bien un truc que je ne veux pas auto-héberger pour l'instant c'est un service d'IA. C'est onéreux et ca change tout le temps. Le temps d'écrire ce message il y aura déjà 3 nouveaux modèles annoncés et 5 études qui démontrent qu'il ne faut pas les utiliser.
Pour la confidentialité des données au hasard. :o

Burn2

Pour la confidentialité des données au hasard. :o
Tu postes des "données" dans un prompt d'IA de génération de code ? Genre tu as mis les clés privées ou passwords en dur dans le code ? Ou tu upload des résultats SQL qui contiennent les identités bancaires des utilisateurs ? Hmm... j'espère que non.

Perso je ne vois pas ce qu'il y a de confidentiel à demander de la génération de code javascript ou C# pour faire un client socket ou un parseur JSON.

Entre taper ta demande dans google/stackoverflow ou dans un prompt d'IA, je ne vois pas trop la différence en terme de confidentialité.

127.0.0.1

Tu postes des "données" dans un prompt d'IA de génération de code ? Genre tu as mis les clés privées ou passwords en dur dans le code ? Ou tu upload des résultats SQL qui contiennent les identités bancaires des utilisateurs ? Hmm... j'espère que non.

Perso je ne vois pas ce qu'il y a de confidentiel à demander de la génération de code javascript ou C# pour faire un client socket ou un parseur JSON.

Entre taper ta demande dans google/stackoverflow ou dans un prompt d'IA, je ne vois pas trop la différence en terme de confidentialité.
Oui effectivement rien ne change, dans les deux cas, il faut mettre des données anonymes. :love:

127.0.0.1

Tu postes des "données" dans un prompt d'IA de génération de code ? Genre tu as mis les clés privées ou passwords en dur dans le code ? Ou tu upload des résultats SQL qui contiennent les identités bancaires des utilisateurs ? Hmm... j'espère que non.

Perso je ne vois pas ce qu'il y a de confidentiel à demander de la génération de code javascript ou C# pour faire un client socket ou un parseur JSON.

Entre taper ta demande dans google/stackoverflow ou dans un prompt d'IA, je ne vois pas trop la différence en terme de confidentialité.
Certains clients demandent la confidentialité de ton code.
Donc à minima tout ce que tu vas demander à l'ia ne restera pas chez toi.

Et si t'es parano selon ce que peut faire l'ia tu peux te dire que presque tout peut partir là bas et enrichir l'ia.

127.0.0.1

Tu postes des "données" dans un prompt d'IA de génération de code ? Genre tu as mis les clés privées ou passwords en dur dans le code ? Ou tu upload des résultats SQL qui contiennent les identités bancaires des utilisateurs ? Hmm... j'espère que non.

Perso je ne vois pas ce qu'il y a de confidentiel à demander de la génération de code javascript ou C# pour faire un client socket ou un parseur JSON.

Entre taper ta demande dans google/stackoverflow ou dans un prompt d'IA, je ne vois pas trop la différence en terme de confidentialité.
La confidentialité aura plus un lien avec la propriété intellectuelle pour le coup.

Cf les soucis relatif aux licenses open-source.

Aussi un risque de faire fuiter des règles de gestion métier implémentées dedans.

Dans le cas de l'usage des services d'IA générative hébergés, il est extrêmement important de regarder le traitement des données. Par exemple chez Mistral, utiliser leur Chat en ligne revient à leur donner les prompts et le résultat. L'opt-out n'étant possible qu'en version payante. Même auparavant, des linters en ligne pouvaient stocker et conserver les données. OpenAI pareil, il est clairement indiqué dans la FAQ que les utilisations de leur service sont analysées.

C'est même de plus en plus insidieux avec les solutions du marché qui intègrent de l'IA désormais. Il faut éplucher les politiques d'utilisation des données pour s'assurer qu'il n'y a pas risque de fuite. L'ironie du SaaS en gros.

Enfin, le coup des clés privées, tokens, etc en dur dans le code... Perso j'ai arrêté de compter les alertes qui pleuvaient. On peut dire ce qu'on veut, que les devs n'ont qu'à faire attention, etc, si des détecteurs de secrets dans le code ont été créés, c'est pas pour rien. Les mauvaises pratiques, ça va vite.

127.0.0.1

pourquoi ? de l'auto-hébergement ?

S'il y a bien un truc que je ne veux pas auto-héberger pour l'instant c'est un service d'IA. C'est onéreux et ca change tout le temps. Le temps d'écrire ce message il y aura déjà 3 nouveaux modèles annoncés et 5 études qui démontrent qu'il ne faut pas les utiliser.
Hmmmm.... je vois bien cela mis en place pour des environnements hautement régulés/sécurisés où prouver sa chaîne d'approvisionnement est une nécessité absolue.

127.0.0.1

pourquoi ? de l'auto-hébergement ?

S'il y a bien un truc que je ne veux pas auto-héberger pour l'instant c'est un service d'IA. C'est onéreux et ca change tout le temps. Le temps d'écrire ce message il y aura déjà 3 nouveaux modèles annoncés et 5 études qui démontrent qu'il ne faut pas les utiliser.
Stable Diffusion ça va encore, ça évolue, mais souvent les nouveautés sont pas ouf et les anciens modèles tournent sans problème sur les fronts.
Hmmm. Pour autant tout le monde sait aujourd'hui que les développeurs ne peuvent pas être remplacés...
Ça ajoute au ridicule.
Pour le dire simplement, l'idée dans de nombreuses boîtes de virer les petites mains du développement et de garder juste des lead developers assistés de l'I.A. plutôt que des indiens. Chez mon client principal, on a viré plus du quart des développeurs pour les remplacer par Copilot, et ce n'est qu'un début.
Modifié le 08/05/2024 à 16h23

Historique des modifications :

Posté le 08/05/2024 à 16h22


Pour le dire simplement, l'idée dans de nombreuses boîtes de virer les petites mains du développement et de garder juste des lead developers assistés de l'I.A. plutôt que des indiens. Chez mon client principal, on a viré plus du quart des développeurs pour les remplacer par Copilot.

ragoutoutou

Pour le dire simplement, l'idée dans de nombreuses boîtes de virer les petites mains du développement et de garder juste des lead developers assistés de l'I.A. plutôt que des indiens. Chez mon client principal, on a viré plus du quart des développeurs pour les remplacer par Copilot, et ce n'est qu'un début.
Tant que la branche tiens on peut continuer à couper. Jusqu'au moment ou ça craque.

TexMex

Tant que la branche tiens on peut continuer à couper. Jusqu'au moment ou ça craque.

Yes, quand le lead dev décidera de partir pas exemple...

TexMex

Tant que la branche tiens on peut continuer à couper. Jusqu'au moment ou ça craque.

Ah, mais pour dire que la branche tient, c'est une autre paire de manches... il y a le paradoxe du shift technologique pour réduction de coût qui frappe de plein fouet:

1) on rêve qu'une technologie permette de réduire la masse salariale.
2) un manager fait un gros contrat avec un fournisseur de ladite technologie et proclame que le problème est résolu
3) on vire massivement selon les estimations faites
4) les employés survivants doivent absorber la charge de travaille de leurs collègues disparus
5) et ils doivent aussi travailler sur les projets d'adaptation/migration en extrême urgence (mais sans allègement du point 4)
6) les séniors se barrent car ils ne voient plus où ça mène et tant qu'à faire c'est le moment de bouger
7) il ne reste que des juniors sous très haute pression qui doivent en plus intégrer les outils choisis
8) profit ?!?

(perso, pour l'avoir vécu plusieurs fois, je me dis qu'il y a une sorte d'échec éducatif absolument terrible dans les écoles de management... 25 ans à voir ce cycle dévastateur se répéter)

ragoutoutou

Ah, mais pour dire que la branche tient, c'est une autre paire de manches... il y a le paradoxe du shift technologique pour réduction de coût qui frappe de plein fouet:

1) on rêve qu'une technologie permette de réduire la masse salariale.
2) un manager fait un gros contrat avec un fournisseur de ladite technologie et proclame que le problème est résolu
3) on vire massivement selon les estimations faites
4) les employés survivants doivent absorber la charge de travaille de leurs collègues disparus
5) et ils doivent aussi travailler sur les projets d'adaptation/migration en extrême urgence (mais sans allègement du point 4)
6) les séniors se barrent car ils ne voient plus où ça mène et tant qu'à faire c'est le moment de bouger
7) il ne reste que des juniors sous très haute pression qui doivent en plus intégrer les outils choisis
8) profit ?!?

(perso, pour l'avoir vécu plusieurs fois, je me dis qu'il y a une sorte d'échec éducatif absolument terrible dans les écoles de management... 25 ans à voir ce cycle dévastateur se répéter)
Également : les décideurs de ces stratégies de réduction des coûts seront déjà partis ou promus quand une bonne partie de l'activité de dev devient la résolution de la dette technique induite. Et les glorieux décideurs auront rajouté sur leur CV « a transformé avec succès … ».

Fabimaru

Également : les décideurs de ces stratégies de réduction des coûts seront déjà partis ou promus quand une bonne partie de l'activité de dev devient la résolution de la dette technique induite. Et les glorieux décideurs auront rajouté sur leur CV « a transformé avec succès … ».
De fait, une fois partis, si tout s'effondre ce sera parce qu' "ils n'ont pas su garder le cap" en l'absence du super décideur de talent.
L'argumentaire de vente des IA aux entreprises c'est que l'IA permet d'augmenter la productivité ou de réduire les couts.

Et le mieux c'est que cet argumentaire n'a pas besoin d'être vrai !

Il suffit de dire à l'entreprise que tout ses concurrents vont utiliser l'IA et que s'il ne le fait pas il sera le seul à être défavorisé.
Modifié le 08/05/2024 à 20h12

Historique des modifications :

Posté le 08/05/2024 à 20h12


L'argumentaire de vente des IA aux entreprises c'est que l'IA permet d'augmenter la productivité ou de réduire les couts.

Et le mieux c'est que cet argumentaire n'a pas besoin d'être vrai !

Il suffit de dire à l'entreprise que tout ses concurrents vont utiliser l'IA et que s'il ne le fait pas il sera le seul à être défavorisé.

Fermer